Regularización de Representación Contrastiva para Modelos de Visión-Lenguaje-Acción
Regularización contrastiva para modelos de visión, lenguaje y acción. Técnica clave en aprendizaje multimodal que mejora el rendimiento y la robustez de sistemas robóticos y de IA.